隐私计算:如何解决数据隐私之痛?|云岫研究
作者 | 吴晓婷 关若琳
出品|云岫资本企业服务组
数据是数字经济时代的核心生产要素,但数据在自由流通或共享中才能产生更大价值。然而,隐私泄露事件层出不穷,出于数据归属、安全、隐私保护的顾虑,数据价值链不同环节之间流动受阻,分工协作脆弱,很难形成有效闭环。
为使得数据交换具有安全保障,各方都在加大对数据在隐私保护下的挖掘和开发力度。在此背景下,隐私计算的提出以及快速发展,使其在消除“数据孤岛”、合规避险、弥合“信任鸿沟”方面具有重大意义。
2020年被称为"隐私计算元年"。根据国际调研机构Gartner战略科技趋势预测,隐私计算将成为2021年最具潜力的9项技术之一。
那么,隐私计算究竟指什么,有哪些应用场景,现阶段竞争格局如何,未来发展前景是怎样呢?
何为隐私计算?
为数据价值而生,使数据可用但不可见
隐私计算是一类技术统称,旨在保护数据本身不对外泄露的前提下,实现数据分析计算。
隐私计算针对不同的应用场景、信任环境和需求,将不同技术、算法、接口集成在一个平台上,并结合人工智能、机器学习、区块链等跨学科技术,为用户提供综合的解决方案,使得“不分享数据、但分享数据的价值”成为可能。
隐私计算可区分数据承载的具体信息和计算价值,厘清数据使用的“权、责、利”,使得数据可以作为资产流通与变现。
1.关键技术
隐私计算的关键技术包括联邦学习、安全多方计算、机密计算、差分隐私、同态加密。其中,联邦学习、多方安全计算和机密计算目前应用最广。
联邦学习目前商业化更为成熟,适用于机器学习建模;多方安全计算目前支持的功能较少,适用于统计分析、查询等基本功能,但安全性更高;机密计算基于可信任硬件,可以减少对特有软件的信任依赖,但受到硬件采购成本、对硬件厂商信任度等因素的制约。
隐私计算将贯穿整个IaaS基础算力层、BaaS、SaaS服务层。
在算力层,隐私计算与云计算作为重要的IaaS基础设施,同时和AI存在融合空间,可以为数据交换、存储和计算协作的可信环境提供算法支撑。
在BaaS/SaaS层,隐私计算在数据价值挖掘环节可以发挥巨大作用,在金融、医疗、科学研究、社会征信、供应链金融、防伪溯源、社会治理等领域提供基于数据分析的应用服务。
2.驱动因素
1)随着数字要素时代来临,隐私计算潜在市场规模巨大。
大数据市场规模大小一定程度决定隐私计算的行业天花板。根据IDC Global DataSphere统计数据显示,2020年,全球创造了59.0ZB的数据,其中50.4%的数据需要保护;根据Statista报告显示,2020年全球大数据市场收入规模接近600亿美元,未来大数据市场仍将稳步发展,预期增速将达到14%。
由微众银行和毕马威联合发布的《隐私计算行业研究报告2021》显示:“国内市场规模将快速发展,三年后技术服务营收有望触达100-200亿人民币的空间,甚至将撬动千亿级的数据平台运营收入空间。”
随着全球数字化进程加快,在隐私计算推动下,数据孤岛将被打破,从而挖掘数据要素巨大的市场价值,创造新的市场空间。
2)数据安全政策与立法不断完善,助推隐私计算海量需求。
《中华人民共和国网络安全法》《中华人民共和国密码法》《个人信息保护法(草案)》等系列政策法规的陆续出台侧面体现了隐私保护的必要性和紧迫性,也进一步强化了数据安全的法制基础。
2021年6月10日,《中华人民共和国数据安全法》经十三届全国人大常委会第二十九次会议通过并正式发布,将于2021年9月1日起施行。这是中国的第一部关于数据安全的专门法律,将进一步推动各界重视隐私及数据安全的治理、运营及保护。
3)资本助推隐私计算创业公司快速发展。
据福布斯统计,全球网络安全及隐私相关创业企业在2020年共融得107亿美元,与10年前相比增长了5倍。在涉及相关业务的22,156家创业企业中,有1,450家在过去一年中获得前种子轮或种子轮融资。
国内初创企业融资大多处于早期阶段,单笔融资额达到几千万甚至上亿元。
3.制约因素
隐私计算目前在全球还没有成熟的解决方案,大部分项目处于验证性测试阶段,难以实现大规模生产应用。其主要原因有两点:
其一,数据层面,需要将各行各业的数据规范化,数据的格式、关键字等都要一致,这样算法平台才可以有效运作。
其二,算法层面,需要有足够的响应速度,在商业上才有使用价值。
行业结构
1.应用场景
隐私计算已在金融、政府、营销、医药等场景初步商业落地,具体应用模式包括跨域分布式身份的认证、数据授权分享、区块链钱包管理与隐私交易、数据安全匹配、多方联合建模、安全建模应用等。
1)金融场景:主要应用包括数字营销、风控与反欺诈、存客激活与信用分析等。
金融行业数据交易多,对风控要求高;客户付费能力强,数字化程度高,因此是隐私计算的最佳切入点。
2)政府场景:主要应用涉及能源、交通、规划、环保等多行业和多部门。
政务领域具有较完备的数据基础,但需要打通并共享各部门数据,才能支撑各项应用。
3)营销场景:主要应用在精准获客等环节,包括消费者的信息、购买能力等,以便为不同的消费人群提供定制化的服务。
4)医疗场景:主要应用在精准医学、AI制药的核心要素。
医疗机构中的病例数据是最重要的隐私数据,但是单个医疗机构的数据样本不足以支撑大规模的模型训练,需要多方共享数据。
随着三大运营商打造大数据安全开放平台,地方政府安全开放共享政务数据,金融机构需要在风控、营销场景中进行大数据内外融合,大数据安全计算与数据服务将迎来极佳机会点。
2.商业路径探讨
对于BAT等自有数据生态的隐私计算公司,未来会希望通过这项技术做自有数据的商业化变现。
对于中小创业公司,作为中立的技术赋能方,更大的想象空间是通过帮助不同种类的数据所有方和使用方,建设新一代数据流通的基础设施网络,充分发掘数据的价值。
隐私计算公司商业路径预计可分为三个阶段。
第一阶段:从关注个人隐私和数据安全合规的领域开始,成为数据要素的基础设施。此阶段的商业模式主要是以软件售卖、项目交付为主。
在金融、电力、运营商、政府等强调本地化部署、安全的行业,有自研技术实力、理解客户应用场景、技术符合监管标准的独立第三方隐私计算企业非常有机会占据领先地位。
第二阶段:逐步拓展到中小企业和科技公司。此阶段的商业模式主要是按量付费模式。
中小企业和科技公司对于成本敏感,他们更愿意接受可信的安全计算云服务。
第三阶段:当隐私计算成为不可或缺的基础设施,渗透到成千上万的机构时,隐私计算生态网络形成。此阶段主要通过平台费、运营费和提供增值服务的方式实现商业价值。
借助隐私计算平台,不同机构可以自由地实现跨竞争对手的数据源贡献、跨行业的数据共享等。生态构建的力量和平台的兼容能力成为竞争的核心要素。
3.产品评价标准
底层技术能力、产品化程度、公信力成为重要评判维度。
技术能力的衡量维度主要分为技术广度、自研能力与技术深度。
技术广度指对隐私计算技术体系的覆盖度。隐私计算不同的应用场景适用于不同的技术体系。对于核心技术体系覆盖越广、钻研越深的企业,覆盖企业应用场景的能力越强。
技术自研能力可分为完全自研、部分使用开源、完全依赖开源技术三类。尽管基于开源技术可以提供很多应用场景的解决方案,但自研底层架构更加灵活、局限性更小,推动行业核心技术实现自主可控。
技术深度指厂商能够实现的技术功能与优势。
产品能力的衡量维度主要分为产品化能力与数据生态能力。
产品化能力方面,客户希望能够拿到一套简单易用、多功能的解决方案,因此需要公司对客户实际业务场景进行深度理解,兼顾产品并发性、功能丰富度,设计出贴合实际业务需求、符合业务人员展业逻辑的产品。
数据生态方面,数据的可得性和多维性是考察大数据类产品的重要因素。
公信力的衡量维度主要分为行业标准制定参与与否以及行业测评认证结果。
目前,厂商若参与隐私计算行业标准制定,可使得它们得到更好的背书。此外,产品及解决方案是否通过行业测评与认证也可作为判断厂商技术能力的标准之一。
竞争格局
国内外企业正在积极布局隐私计算产业。
国外,Google推出新型多方隐私计算开源库;Facebook将Secure Machine Learning框架CrypTen进行开源。
国内,蚂蚁金服、腾讯云、百度、京东等成熟企业推出了各自集团下的隐私计算产品;以微众银行为代表的金融背景企业也在各自的领域形成一定优势;华控清交、数牍科技等初创厂商掌握多方安全计算的核心技术,实现完全自主研发,提供个性化服务;还有诸多区块链企业、数据安全企业等也纷纷投入隐私计算技术研发与应用中。
微众银行、华控清交、翼方健数、蚂蚁金服被称为国内隐私计算赛道领跑的“四小龙”。
微众银行在融合密码算法、隐私保护算法、安全多方计算等技术的基础上,开发了一套即时可用的场景式隐私保护解决方案WeDPR。
华控清交专攻多方安全计算,其PrivPy平台实现了高性能通用的安全计算框架、集群化和可扩展的解决方案。
翼方健数旗下XDP翼数坊是以“数据和计算的互联网”(IoDC)为核心,建设开放生态。
蚂蚁集团下摩斯多方安全计算平台拥有100多项相关专利,已在十余个行业成功实现商用。
隐私计算工具化、模块化进展明显,但隐私计算是问题导向而非技术导向。
第一,自研产品仍为主流模式,开源生态逐渐显现;
第二,与区块链、机器学习、AI等其他技术不断协同,整体推动数据可信可流通;
第三,目前市场上很多厂商是联邦学习和多方安全计算两种技术相结合,安全与效率逐渐平衡;
第四,现阶段不同企业间差异点主要在数据源、解决方案面向的行业及场景,关键技术层面的差异不大。
总结与展望
我们对隐私计算市场的趋势有如下总结与判断:
1.隐私计算是解决数据隐私之痛,释放数据市场巨大经济价值的关键,具有极大发展空间。
第一,在法律法规、行业政策等顶层设计不断迭代完善下,数据安全和隐私保护合规要求将更加明确,进而牵引隐私计算市场潜力释放。
第二,隐私计算本身技术难度很大,算法优化和硬件提升将进一步提高隐私计算技术的可用性,以此激发算法、PaaS、SaaS层的应用,共同促进数据市场快速发展。
第三,随着隐私计算热度的升温、科学严谨的隐私保护计算技术产品和解决方案评估机制的建立、解决方案的实际落地,公众对隐私保护计算技术的认知程度有望提升。
2.未来数据市场将会出现一批依托隐私计算的平台型公司,开辟数据运营商模式,充当数据存储,交换和价值挖掘的核心媒介。
企业初期可从数据密集型行业切入,摸清行业痛点,再从预算充足、数字化程度高的头部企业渗透到中小客户;后期可通过数据交换或SaaS服务收费模式盈利。
3.投资角度,隐私计算赛道处于早期,目前处于快速成长阶段,投资回报率预期将较高。
隐私计算产业生态将逐步建立,由金融、政务、医疗等数据密集型行业不断扩展至其他领域。进行投资分析时更看重企业与场景结合的产品化能力、技术能力、团队技术背景及资源整合能力、多行业布局的企业战略等。
部分参考资料
[1] 中国信息通信研究院安全研究所,阿里巴巴集团安全部,北京数牍科技有限公司:隐私保护计算技术研究报告(2020 年).[2] 中国信通院大数据技术标准推进委员会:隐私计算产品测试及行业发展观察.[3] 中国信通院大数据技术标准推进委员会:隐私计算——实现数据价值释放的突破口.[4] 通证通研究院:2019区块链行业技术引卷之隐私计算.[5] 矩阵元,陀螺研究院:隐私计算技术发展报告.[6] 晨山资本:隐私计算加持,数据流通与隐私保护可以两全.[7]爱分析:隐私计算迎来落地考验,科技风口行业如何去伪存真.[8]21世纪经济报道:《数据安全法》落地,催生“隐私计算”等新风口,万亿规模数据产业迎新机.[9] Gartner: Top Strategic Technology Trends for 2021.
云岫资本是中国领先的科技产业精品投行及私募股权投资机构,公司业务包括私募融资、兼并收购及私募股权投资,深度覆盖半导体、人工智能、智能制造、IT基础设施、工业互联网、智能汽车、企业服务、金融科技、医疗科技等新兴技术驱动的数字智能产业,致力于为中国顶级的技术创业者提供最顶级的精品投行服务。
云岫资本总部位于上海,并在北京、深圳设有办公室,拥有40余位专业人士,团队核心成员来自斯坦福大学、清华大学、北京大学、中国科学技术大学等海内外知名高校以及微软、博通、海思、应用材料等高科技企业。自2015年创立以来,云岫已帮助客户成功完成超120笔,超250亿人民币私募融资及并购交易。